YOLOv10 (2024)

1. 서론

현대 인공지능 응용 분야에서 실시간 객체 검출(real-time object detection)은 자율주행, 로보틱스, 지능형 감시 시스템 등 다양한 기술의 핵심적 기반을 형성한다.1 2015년 처음 등장한 이래, YOLO(You Only Look Once) 계열은 속도와 정확도 사이의 탁월한 균형점을 제시하며 실시간 객체 검출 분야의 지배적인 패러다임으로 확고히 자리매김하였다.4

지속적인 발전을 거듭해 온 YOLO 계열은 그러나 두 가지 근본적인 기술적 한계에 직면해 있었다. 첫째는 후처리 과정인 비최대 억제(Non-Maximum Suppression, NMS)에 대한 높은 의존성으로, 이는 추론 지연 시간을 증가시키고 진정한 의미의 종단간(end-to-end) 배포를 저해하는 주요 병목으로 작용했다. 둘째는 모델 아키텍처 내에 잠재된 상당한 계산적 중복성으로, 이는 자원의 비효율적 사용과 성능 향상의 제약으로 이어졌다.4

본 안내서는 2024년 5월 칭화대학교 연구진에 의해 발표된 YOLOv10의 기술적 기여를 심층적으로 분석하는 것을 목표로 한다.8 이를 위해 먼저 YOLO의 역사적 발전 과정과 기존 모델들이 마주한 기술적 한계를 고찰한다. 다음으로, YOLOv10이 이러한 한계를 극복하기 위해 제시하는 두 가지 핵심 혁신 전략, 즉 NMS-Free 훈련을 위한 ’일관된 이중 할당(Consistent Dual Assignments)’과 ’총체적 효율성-정확도 기반 모델 설계(Holistic Efficiency-Accuracy Driven Model Design)’를 상세히 해부한다. 마지막으로, 주요 경쟁 모델과의 정량적 성능 비교 분석을 통해 YOLOv10의 기술적 의의를 객관적으로 평가하고, 향후 실시간 객체 검출 기술의 발전 방향을 전망한다.

2. YOLO 계보의 발전과 기술적 한계

2.1 1단계 검출기 패러다임의 정립과 발전

YOLO의 역사는 실시간 객체 검출 기술의 발전사와 궤를 같이한다. 각 버전은 당대의 기술적 난제를 해결하고 성능의 경계를 확장하며 진화해왔다.

**YOLOv1 (2015)**은 객체 검출을 bounding box 좌표와 클래스 확률을 예측하는 단일 회귀 문제로 재정의하여 패러다임의 전환을 이끌었다. 이미지 전체를 단 한 번의 신경망 통과로 처리하는 혁신적인 접근법을 통해, 2단계 검출기(two-stage detector)의 복잡한 파이프라인을 제거하고 실시간 처리를 현실화했다.1

**YOLOv2 (2016)와 YOLOv3 (2018)**는 초기 모델의 한계를 개선하는 데 집중했다. YOLOv2는 사전 정의된 형태의 상자인 앵커 박스(anchor box) 개념을 도입하여 다양한 종횡비의 객체를 효과적으로 검출할 수 있게 했으며, Darknet-19 백본으로 성능을 높였다.7 YOLOv3는 더 깊어진 Darknet-53 백본과 세 가지 다른 스케일에서 특징을 추출하여 예측하는 다중 스케일 예측(multi-scale prediction)을 통해 작은 객체에 대한 검출 정확도를 획기적으로 향상시켰다.13

**YOLOv4 (2020)와 YOLOv5 (2020)**는 훈련 기법과 사용성을 최적화했다. YOLOv4는 훈련 과정에서만 비용을 추가하고 추론 시에는 부담을 주지 않는 ’Bag of Freebies’와 약간의 추론 비용 증가로 성능을 크게 높이는 ‘Bag of Specials’ 개념을 도입하여 모델 최적화의 새로운 방향을 제시했다.14 YOLOv5는 PyTorch 프레임워크를 기반으로 설계되어 높은 사용 편의성과 빠른 훈련 속도를 제공함으로써 산업계와 연구 커뮤니티에서 폭넓게 채택되는 계기를 마련했다.7

**YOLOv6 (2022)부터 YOLOv8 (2023)**까지는 앵커 박스에 의존하지 않는 앵커-프리(anchor-free) 방식, 훈련과 추론 시 네트워크 구조를 변경하여 효율성을 높이는 모델 재매개변수화(re-parameterization), 그리고 분류와 회귀 헤드를 분리하여 성능을 개선하는 분리된 헤드(decoupled head) 등 최신 연구 성과들을 적극적으로 도입하며 아키텍처를 지속적으로 개선했다.16

**YOLOv9 (2024)**는 심층 신경망에서 발생하는 정보 손실 문제, 즉 정보 병목(information bottleneck) 현상을 해결하는 데 초점을 맞췄다. 이를 위해 프로그래밍 가능한 경사 정보(Programmable Gradient Information, PGI)와 일반화된 효율적 레이어 집계 네트워크(Generalized Efficient Layer Aggregation Network, GELAN)를 도입하여, 네트워크의 깊은 층까지 신뢰할 수 있는 그래디언트가 전달되도록 보장함으로써 정확도를 한 단계 더 끌어올렸다.12

2.2 기존 YOLO의 근본적 병목 현상

이러한 눈부신 발전에도 불구하고, YOLO 계열은 두 가지 근본적인 문제점을 지속적으로 안고 있었다. YOLOv10은 바로 이 문제들을 해결의 대상이 아닌 제거의 대상으로 재정의하며 등장했다.

2.2.1 NMS 후처리 의존성

대부분의 YOLO 모델은 훈련 시 하나의 실측 객체(ground-truth object)에 대해 다수의 긍정 예측(positive predictions)을 할당하는 ‘one-to-many’ 레이블 할당 전략을 사용한다. 이 방식은 모델이 풍부한 감독 신호를 통해 견고하게 학습하도록 돕지만, 추론 단계에서 필연적으로 하나의 객체에 대해 여러 개의 중복된 경계 상자를 생성하게 된다.4

이 중복을 제거하기 위해 비최대 억제(NMS)라는 후처리 알고리즘이 필수적으로 사용된다. NMS는 모든 예측 상자를 신뢰도 점수(confidence score) 순으로 정렬한 뒤, 가장 높은 점수의 상자를 선택하고 이와 중첩률(Intersection over Union, IoU)이 특정 임계값을 넘는 나머지 상자들을 제거하는 과정을 반복한다.17 이 과정은 순차적으로 진행되어 병렬화가 어렵고, 예측 상자의 수에 따라 계산 비용이 증가하여 상당한 추론 지연(latency)을 유발하는 핵심 병목으로 작용한다.4

더욱이 NMS는 학습 가능한 신경망의 일부가 아닌, 하이퍼파라미터에 의존하는 별도의 알고리즘이다. 이는 모델의 종단간(end-to-end) 배포를 방해하고, NMS 임계값 설정에 따라 최종 성능이 민감하게 변동하는 문제를 야기한다.4

2.2.2 아키텍처의 내재적 비효율성

기존 YOLO 모델들은 구성 요소들에 대한 총체적이고 면밀한 분석 없이 설계되어 상당한 계산 중복성을 내포하고 있었다.8 예를 들어, 객체의 종류를 판별하는 분류(classification) 작업은 위치를 정밀하게 찾는 회귀(regression) 작업에 비해 상대적으로 단순함에도 불구하고, 두 작업을 처리하는 예측 헤드(head)가 동일한 복잡도를 갖는 경우가 많았다. 또한, 특징 맵의 해상도를 줄이는 다운샘플링 과정에서 공간 차원 축소와 채널 수 변환이 하나의 합성곱 연산으로 동시에 처리되면서 불필요한 계산 비용과 정보 손실이 발생했다.23

이러한 구조적 비효율성은 모델의 파라미터 수와 연산량(FLOPs)을 불필요하게 증가시켜 효율성을 저해했다. 이는 단순히 속도 저하 문제에 그치지 않고, 제한된 모델 용량(capacity)으로 인해 잠재적인 정확도 향상 기회를 제약하는 요인으로도 작용했다.8 과거의 YOLO 발전이 정확도와 속도 사이의 최적의 ’타협점’을 찾는 과정이었다면, YOLOv10은 NMS와 아키텍처 비효율성을 타협의 대상이 아닌, 근본적으로 제거해야 할 ’병목’으로 규정했다. 이는 문제 해결의 관점을 표면적 성능 개선에서 파이프라인 전체의 구조 혁신으로 전환시킨 것으로, CNN 기반 검출기가 트랜스포머 기반 종단간 검출기(예: DETR)의 구조적 장점을 수용하면서도 YOLO 고유의 효율성을 유지하려는 시도라는 점에서 중요한 의의를 가진다.8

3. YOLOv10의 핵심 제안: 이중 혁신 전략

YOLOv10은 앞서 제기된 두 가지 근본적 병목을 해결하기 위해, 후처리 단계와 모델 아키텍처를 동시에 혁신하는 이중 전략을 채택했다. 이는 ’훈련 복잡도’와 ’추론 효율성’을 전략적으로 교환하는 새로운 설계 철학을 기반으로 한다.

3.1 NMS-Free를 위한 일관된 이중 할당

YOLOv10은 추론 시 NMS를 완전히 제거하기 위해, 훈련 과정에서 두 종류의 예측 헤드를 동시에 활용하는 독창적인 ‘이중 할당(Dual Assignments)’ 구조를 도입했다.21

3.1.1 이중 할당 아키텍처

YOLOv10의 탐지 헤드는 두 개의 분기(branch)로 구성된다.

  • One-to-Many 헤드: 기존 YOLO와 동일하게 하나의 실측 객체에 여러 개의 긍정 예측을 할당한다. 이는 모델의 백본(backbone)과 넥(neck)이 풍부하고 다양한 감독 신호(rich supervision)를 통해 강력한 특징 표현을 학습하도록 유도하는 ‘교사’ 역할을 수행한다.24
  • One-to-One 헤드: 각 실측 객체에 대해 단 하나의 가장 일치하는 예측만을 할당한다. 이 방식은 훈련 시 감독 신호가 부족하여 단독으로 사용될 경우 성능 저하를 야기할 수 있지만, 추론 시에는 중복 예측을 원천적으로 방지하여 NMS를 불필요하게 만든다.10

YOLOv10은 훈련 단계에서 이 두 헤드를 동시에 최적화한다. One-to-Many 헤드가 제공하는 풍부한 그래디언트가 모델 전체의 학습을 주도하는 동안, One-to-One 헤드는 이 학습된 특징을 공유받아 함께 성장한다. 그리고 추론 시에는 오직 경량의 One-to-One 헤드만을 사용하여, NMS 없이 빠르고 효율적인 종단간 예측을 수행한다.21 이는 훈련 과정의 복잡성을 감수하는 대신, 실시간 응용에서 가장 중요한 추론 효율성을 극대화하는 전략적 선택이다.

3.1.2 일관된 매칭 메트릭과 손실 함수

두 헤드는 서로 다른 할당 전략을 사용하기 때문에, 최상의 예측을 선택하는 기준이 다를 경우 훈련이 불안정해지고 One-to-One 헤드의 성능이 저하될 수 있다.23 YOLOv10은 이 문제를 해결하기 위해 두 헤드에 동일하게 적용되는 ‘일관된 매칭 메트릭(consistent matching metric)’ m을 제안했다. 이 메트릭은 예측의 분류 점수 s와 실측값과의 IoU u를 결합하여 정의된다.25
m = s^{\alpha} \times u^{\beta}
위 식에서 \alpha\beta는 분류 점수와 IoU의 상대적 중요도를 조절하는 하이퍼파라미터이다. 이 통일된 메트릭을 통해 두 헤드는 동일한 기준으로 최상의 예측 샘플을 선택하게 되며, 이는 두 헤드 간의 감독 신호를 조화롭게 정렬하여 One-to-One 헤드의 추론 성능을 극대화하는 효과를 가져온다.

YOLOv10의 전체 손실 함수 L_{total}은 One-to-Many 헤드의 손실 L_m과 One-to-One 헤드의 손실 L_o의 가중합으로 구성된다.
L_{total} = \lambda_m L_m + \lambda_o L_o
각 헤드의 손실은 YOLOv8 등 최신 YOLO 모델과 유사하게 분류 손실(L_{cls}), 회귀 손실(L_{reg}), 그리고 분포 초점 손실(Distribution Focal Loss, L_{dfl})의 합으로 계산된다.2

3.2 총체적 효율성-정확도 기반 모델 설계

YOLOv10은 NMS 제거와 더불어, 모델 아키텍처의 모든 구성 요소를 효율성과 정확도 관점에서 전면적으로 재검토하고 최적화했다.

3.2.1 효율성 극대화 전략

  • 경량 분류 헤드 (Lightweight Classification Head): 객체 검출에서 분류 작업이 위치 회귀보다 상대적으로 계산 부담이 적다는 관찰에 기반하여, 분류 헤드의 구조를 대폭 경량화했다. 기존의 무거운 합성곱 블록 대신, 2개의 3x3 깊이별 분리 합성곱(depthwise separable convolution)과 1x1 점별 합성곱(pointwise convolution)으로 구성된 단순한 구조를 채택하여 파라미터와 연산량을 크게 절감했다.8
  • 공간-채널 분리 다운샘플링 (Spatial-Channel Decoupled Downsampling): 기존의 3x3 stride-2 합성곱은 공간적 다운샘플링과 채널 변환을 동시에 수행하며 정보 손실과 높은 계산 비용을 유발했다. YOLOv10은 이 두 연산을 분리했다. 먼저 1x1 점별 합성곱으로 채널 차원을 효율적으로 조절한 후, 3x3 깊이별 합성곱으로 공간 차원을 축소한다. 이 방식을 통해 계산 비용을 줄이면서도 다운샘플링 과정에서의 정보 보존력을 높였다.23
  • 순위 기반 블록 설계 (Rank-Guided Block Design): 심층 신경망의 깊은 단계에서는 특징 맵에 정보의 중복성이 발생하기 쉽다. YOLOv10은 각 단계의 마지막 합성곱 레이어의 행렬 순위(matrix rank)를 분석하여 정보의 중복성을 정량적으로 측정한다. 그리고 중복성이 높다고 판단되는 단계의 기본 블록(예: YOLOv8의 C2f 블록)을 더 가볍고 효율적인 CIB(Compact Inverted Block) 구조로 대체한다. CIB는 깊이별 합성곱과 경제적인 점별 합성곱을 사용하여 최소한의 비용으로 특징을 융합함으로써 모델 전체의 파라미터 효율성을 극대화한다.24

3.2.2 정확도 향상 전략

  • 대형 커널 컨볼루션 (Large-Kernel Convolution): 모델의 수용장(receptive field)을 넓혀 더 넓은 문맥 정보를 포착하고 특징 추출 능력을 강화하기 위해, CIB 블록과 같은 깊은 단계에서 3x3 깊이별 합성곱 중 일부를 7x7과 같은 더 큰 커널로 대체한다. 이는 최소한의 파라미터 및 계산량 증가로 상당한 성능 향상을 가져오는 효과적인 전략이다.8
  • 부분적 셀프 어텐션 (Partial Self-Attention, PSA): 이미지 전역의 장거리 의존성을 모델링하기 위해 셀프 어텐션(self-attention) 메커니즘을 도입하되, 높은 계산 복잡도를 완화하기 위해 효율적으로 설계했다. PSA 모듈은 특징 맵의 채널을 분할하여 일부에만 주의 메커니즘을 적용하고, 쿼리(query)와 키(key)의 차원을 값(value)의 절반으로 줄여 연산량을 줄였다. 이 모듈은 특징 맵의 해상도가 가장 낮은 마지막 단계에만 배치하여 셀프 어텐션 메커니즘의 이점은 취하면서도 계산 오버헤드는 최소화했다.8

4. 성능 분석 및 비교 고찰

YOLOv10의 기술적 혁신은 실제 성능 지표에서 뚜렷한 우위로 나타난다. COCO 데이터셋을 기준으로 한 벤치마크 결과는 YOLOv10이 기존의 정확도-효율성 경계를 한 단계 끌어올렸음을 명확히 보여준다.

4.1 정량적 성능 벤치마크

YOLOv10은 다양한 모델 스케일에서 이전 버전 및 주요 경쟁 모델 대비 압도적인 성능과 효율성을 입증했다.

  • RT-DETR 대비: YOLOv10-S는 유사한 정확도(AP 46.5%)에서 RT-DETR-R18보다 1.8배 빠르며, 파라미터와 FLOPs는 2.8배 더 적다.4
  • YOLOv9 대비: YOLOv10-B는 YOLOv9-C와 동일한 성능(AP 53.0%)을 달성하면서도, 추론 지연 시간은 46%, 파라미터 수는 25% 감소시켰다.8
  • YOLOv8 대비: YOLOv10-L과 YOLOv10-X는 YOLOv8-L/X보다 각각 0.3 AP, 0.5 AP 더 높은 정확도를 보이면서도 파라미터 수는 1.8배에서 2.3배까지 더 적다.4
  • YOLOv6 대비: YOLOv10-S는 YOLOv6-3.0-S에 비해 AP는 1.4% 높고, 파라미터는 36% 적으며, 지연 시간은 65%나 단축되었다.27

이러한 결과를 종합한 아래 표는 YOLOv10의 기술적 우월성을 명확하게 보여주는 핵심 자료이다.

모델 (Model)APval (%)Latency (ms)Parameters (M)FLOPs (G)
YOLOv8-L52.9-43.6165.2
YOLOv8-X53.9-68.1257.8
YOLOv9-C53.09.925.3102.8
RT-DETR-R1846.54.920.866.8
RT-DETR-R10154.311.192.2290.4
YOLOv10-S46.52.78.022.5
YOLOv10-B53.05.319.061.4
YOLOv10-L53.28.227.898.2
YOLOv10-X54.412.039.7145.4

4.2 정확도-지연시간 트레이드오프 분석

위 표의 데이터를 정확도-지연 시간 평면에 시각화하면, YOLOv10 모델군이 기존의 모든 모델보다 좌상단에 위치하며 새로운 파레토 최적 경계(Pareto front)를 형성하는 것을 확인할 수 있다. 이는 모든 모델 규모에서 YOLOv10이 더 낮은 지연 시간으로 더 높거나 동등한 수준의 정확도를 달성했음을 의미한다. 특히 NMS 후처리를 제거한 효과는 추론 지연 시간을 극적으로 단축시켜, 실시간 응용 분야에서의 경쟁력을 극대화했다.8

4.3 자원 효율성 평가

YOLOv10의 진정한 가치는 단순히 빠르고 정확하다는 점을 넘어, 자원 효율성에 있다. 예를 들어, YOLOv10-L은 YOLOv8-L보다 더 높은 AP를 달성하면서도 파라미터 수는 약 1.8배(43.6M vs 27.8M)나 적다.4 이는 ‘총체적 효율성-정확도 기반 모델 설계’ 전략이 계산 중복성을 성공적으로 제거하고 아키텍처의 파라미터 효율성을 극한까지 끌어올렸음을 증명한다.

이러한 분석은 YOLOv10이 모든 면에서 절대적으로 우월한 ‘만능’ 모델이라기보다는, ’실시간 종단간 객체 검출’이라는 명확한 목표에 극도로 ’특화된 최적화’의 결과물임을 시사한다. 지연 시간과 배포 용이성이 최우선 과제인 엣지 컴퓨팅이나 실시간 비디오 분석과 같은 응용 분야에서는 현존하는 가장 강력한 솔루션이라 할 수 있다.12 반면, 추론 시간의 여유가 있고 최고의 정확도가 요구되는 일부 고정밀 분석 작업에서는 YOLOv9의 PGI와 같은 복잡한 메커니즘이 더 유리할 수도 있다.12 이는 AI 모델의 발전이 단일한 방향이 아닌, 다양한 응용 시나리오에 맞춰 분화되고 있음을 보여주며, 모델 선택이 ’최신’이 아닌 ’최적’의 관점에서 이루어져야 함을 강조한다.

5. 결론 및 향후 전망

5.1 YOLOv10의 기여와 의의

YOLOv10은 실시간 객체 검출 분야에서 중요한 기술적 이정표를 세웠다.

  • 종단간 검출의 실현: NMS 후처리를 성공적으로 제거함으로써, CNN 기반 객체 검출기를 진정한 의미의 종단간(end-to-end) 방식으로 구현했다. 이는 모델의 배포 과정을 단순화하고 추론 파이프라인의 예측 가능성을 크게 향상시키는 중요한 성과이다.12
  • 성능-효율성 경계의 재정의: 총체적인 아키텍처 설계를 통해 기존의 정확도-지연 시간 트레이드오프를 한 단계 뛰어넘는 새로운 기준을 제시했다. 특히 더 적은 계산 자원으로 더 높은 성능을 달성함으로써, 리소스가 제한된 하드웨어 환경에서도 고성능 AI를 구현할 수 있는 가능성을 확장했다.8
  • 새로운 설계 방법론 제시: ’훈련 복잡도를 통한 추론 효율성 극대화’와 ’총체적 최적화’라는 설계 철학은 향후 실시간 AI 모델 개발에 중요한 영감과 방향성을 제공한다.

5.2 한계 및 비판적 고찰

뛰어난 성과에도 불구하고 YOLOv10은 몇 가지 한계점을 가진다.

  • 제한된 다재다능성: YOLOv10은 객체 검출 작업에 고도로 특화되어 있어, YOLOv8과 같이 인스턴스 분할(instance segmentation)이나 자세 추정(pose estimation) 등 다양한 컴퓨터 비전 작업을 지원하는 통합 프레임워크로서의 기능은 상대적으로 부족하다.29
  • 혁신성의 본질: 일부 비평가들은 이중 할당, 경량 헤드 등 YOLOv10을 구성하는 개별 기술 요소들이 완전히 새로운 개념이라기보다는, 기존에 제안된 아이디어들을 매우 효과적으로 조합하고 최적화한 ’엔지니어링의 승리’에 가깝다는 의견을 제시한다. 즉, 아키텍처 자체의 근본적인 혁신보다는 훈련 전략의 혁신이 더 두드러진다는 평가도 존재한다.22
  • 데이터셋 의존성: 특정 불균형 데이터셋에서는 작은 객체에 대한 정확도가 이전 버전에 비해 저하될 수 있다는 실험 결과가 보고된 바 있으며, 이는 모델의 일반화 성능에 대한 추가적인 검증이 필요함을 시사한다.30

5.3 향후 연구 방향 및 전망

YOLOv10이 제시한 종단간 실시간 검출 패러다임은 향후 객체 검출 기술 발전에 중요한 토대가 될 것이다.

  • 엣지 AI와의 결합 심화: YOLOv10의 경량성과 높은 효율성은 엣지 디바이스 및 IoT 환경으로의 AI 기술 통합을 더욱 가속화할 것이다. 향후에는 하드웨어 특성에 더욱 최적화된 양자화(quantization) 및 가지치기(pruning) 기법과의 결합 연구가 활발해질 것으로 예상된다.31
  • 자기 지도 학습의 도입: 막대한 양의 레이블링된 데이터에 대한 의존도를 줄이기 위해, 방대한 비지도 데이터를 활용하는 자기 지도 학습(self-supervised learning) 방법론이 YOLO 계열의 사전 훈련 과정에 통합될 가능성이 높다.32
  • 멀티모달 통합: 시각 정보뿐만 아니라 LiDAR, 열화상, 텍스트 등 다른 양식의 데이터를 함께 활용하는 멀티모달(multi-modal) 객체 검출로 발전하여, 악천후나 저조도 환경과 같은 까다로운 조건에서의 강건성을 획기적으로 높이는 방향으로 나아갈 것이다.32
  • 새로운 아키텍처의 탐색: YOLOv10이 CNN 아키텍처의 효율성을 극한으로 끌어올렸지만, Vision Transformer(ViT)나 상태 공간 모델(State Space Models)과 같은 새로운 아키텍처와의 융합을 통해 성능과 효율성의 새로운 돌파구를 찾으려는 시도는 계속될 것이다.

6. 참고 자료

  1. YOLOv1 to YOLOv10: The fastest and most accurate real-time object detection systems - arXiv, https://arxiv.org/html/2408.09332v1
  2. The YOLO Framework: A Comprehensive Review of Evolution, Applications, and Benchmarks in Object Detection - MDPI, https://www.mdpi.com/2073-431X/13/12/336
  3. YOLO Evolution: A Comprehensive Benchmark and Architectural Review of YOLOv12, YOLO11, and Their Previous Versions - arXiv, https://arxiv.org/html/2411.00201v2
  4. YOLOv10: Real-Time End-to-End Object Detection, https://arxiv.org/pdf/2405.14458
  5. YOLOv10: Real-Time End-to-End Object Detection - ResearchGate, https://www.researchgate.net/publication/380821008_YOLOv10_Real-Time_End-to-End_Object_Detection
  6. en.wikipedia.org, [https://en.wikipedia.org/wiki/You_Only_Look_Once#::text=You%20Only%20Look%20Once%20(YOLO,most%20popular%20object%20detection%20frameworks.](https://en.wikipedia.org/wiki/You_Only_Look_Once#::text=You Only Look Once (YOLO,most popular object detection frameworks.)
  7. The Evolution of YOLO: Object Detection Algorithms | Mindy Support Outsourcing, https://mindy-support.com/news-post/the-evolution-of-yolo-object-detection-algorithms/
  8. YOLOv10: Real-Time End-to-End Object Detection - arXiv, https://arxiv.org/html/2405.14458v1
  9. [2405.14458] YOLOv10: Real-Time End-to-End Object Detection - arXiv, https://arxiv.org/abs/2405.14458
  10. NeurIPS Poster YOLOv10: Real-Time End-to-End Object Detection, https://neurips.cc/virtual/2024/poster/93301
  11. YOLOv10: Real-Time End-to-End Object Detection [NeurIPS 2024] - GitHub, https://github.com/THU-MIG/yolov10
  12. YOLOv10 vs. YOLOv9: A Technical Comparison - Ultralytics YOLO Docs, https://docs.ultralytics.com/compare/yolov10-vs-yolov9/
  13. YOLO Explained: From v1 to Present - Viso Suite, https://viso.ai/computer-vision/yolo-explained/
  14. The Evolution of YOLO: From Single Shot Detection to State-of-the-Art Object Recognition, https://medium.com/@shaomukherjee/the-evolution-of-yolo-from-single-shot-detection-to-state-of-the-art-object-recognition-2670f96f730c
  15. The history of YOLO: The origin of the YOLOv1 algorithm | SuperAnnotate, https://www.superannotate.com/blog/yolov1-algorithm
  16. Evolution of YOLO: A Timeline of Versions and Advancements in Object Detection, https://yolovx.com/evolution-of-yolo-a-timeline-of-versions-and-advancements-in-object-detection/
  17. Evolution of YOLO Object Detection Model From V5 to V8 [Updated] - Labellerr, https://www.labellerr.com/blog/evolution-of-yolo-object-detection-model-from-v5-to-v8/
  18. What is YOLO? The Ultimate Guide [2025] - Roboflow Blog, https://blog.roboflow.com/guide-to-yolo-models/
  19. Comparative Performance of YOLOv8, YOLOv9, YOLOv10, and YOLOv11 for Layout Analysis of Historical Documents Images - MDPI, https://www.mdpi.com/2076-3417/15/6/3164
  20. YOLOv10 object detection Better, Faster and Smaller now on GitHub - visionplatform.ai, https://visionplatform.ai/yolov10-object-detection/
  21. YOLOv10: Advanced Real-Time End-to-End Object Detection | DigitalOcean, https://www.digitalocean.com/community/tutorials/yolov10-advanced-real-time-end-to-end-object-detection
  22. YOLOv10: Real-Time End-to-End Object Detection - OpenReview, https://openreview.net/forum?id=tz83Nyb71l&referrer=%5Bthe%20profile%20of%20Jungong%20Han%5D(%2Fprofile%3Fid%3D~Jungong_Han1)
  23. YOLOv10: The Dual-Head OG of YOLO Series - LearnOpenCV, https://learnopencv.com/yolov10/
  24. YOLOv10: Real-Time End-to-End Object Detection - Ultralytics YOLO Docs, https://docs.ultralytics.com/models/yolov10/
  25. What is YOLOv10? An Architecture Deep Dive. - Roboflow Blog, https://blog.roboflow.com/what-is-yolov10/
  26. Detailed Architecture of YOLOv10 - Labelvisor, https://www.labelvisor.com/detailed-architecture-of-yolov10/
  27. Applications of YOLOv10 in Object Detection - Labelvisor, https://www.labelvisor.com/applications-of-yolov10-in-object-detection/
  28. Comparing YOLOv10 with Other Object Detection Models - Labelvisor, https://www.labelvisor.com/comparing-yolov10-with-other-object-detection-models/
  29. YOLO11 vs YOLOv10: A Detailed Technical Comparison - Ultralytics YOLO Docs, https://docs.ultralytics.com/compare/yolo11-vs-yolov10/
  30. Comparing YOLOv10, YOLOv9, and YOLOv8: A Performance Study | by Azam Kowalczyk, https://medium.com/@az.tayyebi/comparing-yolov10-yolov9-and-yolov8-a-performance-study-41e3072fa0e8
  31. YOLOv10: The Next Evolution in Real-Time Object Detection - My Framer Site - ezML, https://ezml.io/blog/yolov10-real-time-object-detection
  32. From YOLO to the Future: Key Advancements in Object Detection Algorithms - Medium, https://medium.com/@v2solutions/from-yolo-to-the-future-key-advancements-in-object-detection-algorithms-f71713585c6e